智能论文笔记

Learning Skills to Navigate without a Master: A Sequential Multi-Policy Reinforcement Learning Algorithm

Ambedkar Dukkipati , Rajarshi Banerjee , Ranga Shaarad Ayyagari , Dhaval Parmar Udaybhai

分类：人工智能 | 机器人

2021-01-30

使用强化学习解决复杂的问题必须将问题分解为可管理的任务，无论是明确或隐式的任务，并学习解决这些任务的政策。反过来，这些政策必须由采取高级决策的总体政策来控制。这需要培训算法在学习这些政策时考虑这种等级决策结构。但是，实践中的培训可能会导致泛化不良，要么在很少的时间步骤执行动作，要么将其全部转变为单个政策。在我们的工作中，我们介绍了一种替代方法来依次学习此类技能，而无需使用总体层次的政策。我们在环境的背景下提出了这种方法，在这种环境的背景下，学习代理目标的主要组成部分是尽可能长时间延长情节。我们将我们提出的方法称为顺序选择评论家。我们在我们开发的灵活的模拟3D导航环境中演示了我们在导航和基于目标任务的方法的实用性。我们还表明，我们的方法优于先前的方法，例如在我们的环境中，柔软的演员和软选择评论家，以及健身房自动驾驶汽车模拟器和Atari River RAID RAID环境。

translated by 谷歌翻译

Towards Practical Application of Deep Learning in Diagnosis of Alzheimer's Disease

Harshit Parmar , Eric Walden

分类：机器学习 | 人工智能

2022-12-08

Accurate diagnosis of Alzheimer's disease (AD) is both challenging and time consuming. With a systematic approach for early detection and diagnosis of AD, steps can be taken towards the treatment and prevention of the disease. This study explores the practical application of deep learning models for diagnosis of AD. Due to computational complexity, large training times and limited availability of labelled dataset, a 3D full brain CNN (convolutional neural network) is not commonly used, and researchers often prefer 2D CNN variants. In this study, full brain 3D version of well-known 2D CNNs were designed, trained and tested for diagnosis of various stages of AD. Deep learning approach shows good performance in differentiating various stages of AD for more than 1500 full brain volumes. Along with classification, the deep learning model is capable of extracting features which are key in differentiating the various categories. The extracted features align with meaningful anatomical landmarks, that are currently considered important in identification of AD by experts. An ensemble of all the algorithm was also tested and the performance of the ensemble algorithm was superior to any individual algorithm, further improving diagnosis ability. The 3D versions of the trained CNNs and their ensemble have the potential to be incorporated in software packages that can be used by physicians/radiologists to assist them in better diagnosis of AD.

translated by 谷歌翻译

Low-Power Hardware-Based Deep-Learning Diagnostics Support Case Study

Khushal Sethi , Vivek Parmar , Manan Suri

分类：机器学习

2022-09-03

深度学习研究引起了广泛的兴趣，导致出现了各种各样的技术创新和应用。由于深度学习研究的很大比例关注基于视觉的应用，因此存在使用其中一些技术来实现低功率便携式医疗保健诊断支持解决方案的潜力。在本文中，我们提出了一个基于硬件的嵌入式软件实施显微镜诊断支持系统，用于POC案例研究：（a）厚血液涂片中的疟疾，（b）痰液样品中的结核病，以及（c）（c）粪便中的肠道寄生虫感染样品。我们使用基于挤压网络的模型来减少网络大小和计算时间。我们还利用训练有素的量化技术来进一步减少学习模型的记忆足迹。这使基于显微镜的病原体检测将实验室专家级别的精度分类为独立的嵌入式硬件平台。与基于CPU的常规实施相比，提议的实施功率更高6倍，并且推理时间为$ \ sim $ 3 ms/示例。

translated by 谷歌翻译

An approach to implement Reinforcement Learning for Heterogeneous Vehicular Networks

Bhavya Peshavaria , Sagar Kavaiya , Dhaval K. Patel

分类：机器学习

2022-08-26

本文介绍了基于多代理增强学习的频谱共享频谱共享的概念扩展到异质车辆网络（HETVNET）。在这里，多个车辆对车辆（V2V）链接了其他车辆对接口（V2I）以及其他网络的频谱。车辆网络中的快速变化环境限制了集中CSI并分配渠道的想法。因此，这里使用实施基于ML的方法的想法，以便可以在所有车辆中以分布式方式实施。这里的每个板载单元（OBU）都可以感觉到频道中的信号，并基于该信息运行RL以决定自主采用的频道。在这里，每个V2V链接将是MARL中的代理商。这个想法是训练RL模型，以使这些代理商可以协作而不是竞争。

translated by 谷歌翻译

HTML版本

BioTABQA: Instruction Learning for Biomedical Table Question Answering

Man Luo , Sharad Saxena , Swaroop Mishra , Mihir Parmar , Chitta Baral

分类：自然语言处理 | 人工智能 | 机器学习

2022-07-06

表问题回答（TQA）是一项重要但不足的任务。大多数现有的QA数据集都采用非结构化文本格式，只有很少的数据集使用表作为上下文。据我们所知，在生物医学领域中，没有任何TQA数据集存在经常用于提供信息的生物医学领域。在本文中，我们首先使用22个模板和关于鉴别诊断的生物医学教科书中的上下文来回答数据集Biotabqa的桌子问题。 Biotabqa不仅可以用来教授模型如何从表中回答问题，还可以评估模型如何推广到看不见的问题，这是生物医学应用的重要情况。为了实现概括评估，我们将模板分为17个培训和5个跨任务评估。然后，我们使用BioTABQA上的单个和多任务学习开发两个基准。此外，我们探索教学学习，这是一种显示出令人印象深刻的概括性能的技术。实验结果表明，我们的指导调整模型在各种评估设置中平均比单一和多任务基准平均比单一和多任务基准，更重要的是，更重要的是，指令调整的模型在交叉任务上的基准比5％。

translated by 谷歌翻译

Answer Fast: Accelerating BERT on the Tensor Streaming Processor

Ibrahim Ahmed , Sahil Parmar , Matthew Boyd , Michael Beidler , Kris Kang , Bill Liu , Kyle Roach , John Kim , Dennis Abts

分类：机器学习 | 自然语言处理

2022-06-22

变形金刚已成为主要的机器学习工作负载，它们不仅是自然语言处理任务的事实上的标准，而且还将部署在其他领域，例如视觉和语音识别。许多基于变压器的应用程序都是实时系统，例如机器翻译和Web搜索。这些实时系统通常具有严格的端到端推理潜伏期需求。不幸的是，尽管大多数变压器计算都来自基质乘法，但变压器还包括几种非线性组件，它们在推理过程中倾向于成为瓶颈。在这项工作中，我们加快了张量流处理器上BERT模型的推断。通过小心地将所有非线性组件与矩阵乘法组件融合在一起，我们能够有效地利用芯片矩阵乘法单元，从而通过BERT-1通过BERT-1通过BERT-BASE，确定性的尾巴延迟为130 $ \ MU $ s，比当前的最新时间快6倍。

translated by 谷歌翻译

The Importance of Background Information for Out of Distribution Generalization

Jupinder Parmar , Khaled Saab , Brian Pogatchnik , Daniel Rubin , Christopher Ré

分类：计算机视觉

2022-06-17

医学图像分类中的域概括是可信赖的机器学习在医疗保健中的重要问题。我们发现，相对于经验风险最小化（ERM）的标准基线，利用地面真相异常分段来控制特征归因（OOD）的现有方法的方法差异（OOD）差。我们研究了图像的哪些区域对于医学图像分类很重要，并表明背景的一部分（不包含异常分割）提供了有用的信号。然后，我们开发一个新的特定任务面膜，涵盖所有相关区域。利用这种新的分割面膜可显着提高OOD测试集上现有方法的性能。为了获得比ERM更好的概括结果，我们发现除了使用这些特定任务的掩码外，还必须扩大训练数据大小。

translated by 谷歌翻译

Spatially-Adaptive Multilayer Selection for GAN Inversion and Editing

Gaurav Parmar , Yijun Li , Jingwan Lu , Richard Zhang , Jun-Yan Zhu , Krishna Kumar Singh

分类：计算机视觉 | 机器学习

2022-06-16

现有的GAN倒置和编辑方法适用于具有干净背景的对齐物体，例如肖像和动物面孔，但通常会为更加困难的类别而苦苦挣扎，具有复杂的场景布局和物体遮挡，例如汽车，动物和室外图像。我们提出了一种新方法，以在gan的潜在空间（例如stylegan2）中倒转和编辑复杂的图像。我们的关键想法是用一系列层的集合探索反演，从而将反转过程适应图像的难度。我们学会预测不同图像段的“可逆性”，并将每个段投影到潜在层。更容易的区域可以倒入发电机潜在空间中的较早层，而更具挑战性的区域可以倒入更晚的特征空间。实验表明，与最新的复杂类别的方法相比，我们的方法获得了更好的反转结果，同时保持下游的编辑性。请参阅我们的项目页面，网址为https://www.cs.cmu.edu/~saminversion。

translated by 谷歌翻译

Memory-Oriented Design-Space Exploration of Edge-AI Hardware for XR Applications

Vivek Parmar , Syed Shakib Sarwar , Ziyun Li , Hsien-Hsin S. Lee , Barbara De Salvo , Manan Suri

分类：人工智能

2022-06-08

低功率边缘-AI功能对于支持元视野的设备扩展现实（XR）应用至关重要。在这项工作中，我们研究了两个代表性的XR工作负载：（i）手动检测和（ii）眼睛分割，用于硬件设计空间探索。对于这两种应用，我们都会训练深层神经网络，并分析量化和硬件特定瓶颈的影响。通过模拟，我们评估了CPU和两个收缩推理加速器实现。接下来，我们将这些硬件解决方案与先进的技术节点进行比较。评估了将最新的新兴非易失性记忆技术（STT/SOT/VGSOT MRAM）集成到XR-AI推论管道中的影响。我们发现，可以通过在7nm节点的设计中引入非挥发性记忆来实现手部检测（IPS = 40）和眼部分割（IPS = 6）的显着能源益处（IPS = 40）（IPS = 6）。（推断每秒）。此外，由于MRAM与传统的SRAM相比，由于MRAM的较小形式，我们可以大大减少面积（> = 30％）。

translated by 谷歌翻译

An Artificial Intelligence Dataset for Solar Energy Locations in India

Anthony Ortiz , Dhaval Negandhi , Sagar R Mysorekar , Joseph Kiesecker , Shivaprakash K Nagaraju , Caleb Robinson , Priyal Bhatia , Aditi Khurana , Jane Wang , Felipe Oviedo

分类：机器学习

2022-01-31

可再生能源的快速开发，尤其是太阳能光伏（PV），对于缓解气候变化至关重要。结果，印度设定了雄心勃勃的目标，可以在2030年之前安装500吉瓦的太阳能容量。鉴于预计大量的足迹可以满足可再生能源能源目标，因此对环境价值的土地利用冲突的潜力很高。为了加快太阳能的发展，土地使用计划者将需要访问PV基础设施的最新，准确的地理空间信息。在这项工作中，我们开发了一种露骨的机器学习模型，以使用自由使用的卫星图像绘制印度的公用事业规模的太阳能项目，平均准确性为92％。我们的模型预测得到了人类专家的验证，以获取1363个太阳能光伏农场的数据集。使用此数据集，我们测量了整个印度的太阳足迹，并量化了与PV基础设施发展相关的土地盖修改程度。我们的分析表明，印度超过74％的太阳能发展是建立在具有自然生态系统保护或农业价值的陆生类型上的。

translated by 谷歌翻译